#OpenTelemetry GenAI'21.09.2025
LLM как судья: где срабатывают сигналы, где ломаются и каким должно быть оценивание
'LLM как судья демонстрируют измеримые смещения и уязвимости к атакам; согласие с людьми зависит от задачи и конфигурации. Для продакшна практичнее сочетать трассирование, метрики компонентов и калибровку людей.'